15-sentabr, 2025O'zbek

Python'ning Kolleksiyalar modulini oching: navbatma-navbat navbatma-navbat navbatma-navbat, chastota tahlili uchun Counter va soddalashtirilgan ma'lumotlar tuzilmasi uchun defaultdict-ni o'rganing. Amaliy misollar bilan ishlashni yaxshilang.

Kolleksiyalar moduli chuqur tahlili: deque, Counter & defaultdict optimallashtirish

Pythonning collections moduli ixtisoslashtirilgan konteyner ma'lumot turlari xazinasi bo'lib, Pythonning o'rnatilgan dict, list, set va tuplelariga muqobil variantlarni taqdim etadi. Ushbu ixtisoslashtirilgan konteynerlar ma'lum bir vazifalar uchun ishlab chiqilgan bo'lib, ko'pincha yaxshilangan ishlash yoki kengaytirilgan funksiyalarni taklif qiladi. Ushbu keng qamrovli qo'llanma collections modulidagi eng foydali uchta vositani o'rganadi: deque, Counter va defaultdict. Biz ularning imkoniyatlarini haqiqiy misollar bilan ko'rib chiqamiz va xalqaro miqyosda dasturlash va global dasturlash uchun eng yaxshi amaliyotlarni hisobga olgan holda, Python loyihalarida optimallashtirilgan ishlash uchun ulardan qanday foydalanishni muhokama qilamiz.

Kolleksiyalar modulini tushunish

Batareyalarni o'rnatishdan oldin, collections modulining rolini tushunish muhimdir. U o'rnatilgan ma'lumotlar tuzilmalari kam bo'lgan yoki samarasiz bo'lgan holatlarni hal qiladi. Tegishli collections vositalaridan foydalangan holda, siz yanada ixcham, o'qiladigan va samaraliroq kod yozishingiz mumkin.

deque: Navbat va stekni samarali amalga oshirish

Deque nima?

deque ("dek" deb talaffuz qilinadi) "ikki tomonlama navbat" degan ma'noni anglatadi. Bu ro'yxatga o'xshash konteyner bo'lib, u elementlarni har ikki uchidan ham samarali qo'shish va olib tashlash imkonini beradi. Bu kompyuter ilmida asosiy ma'lumotlar tuzilmalari bo'lgan navbatlar va steklarni amalga oshirish uchun idealdir.

Python ro'yxatlaridan farqli o'laroq, boshidagi elementlarni qo'shish yoki o'chirish uchun samarasiz bo'lishi mumkin (keyingi barcha elementlarni siljitish tufayli), deque ushbu amallar uchun O(1) vaqt murakkabligini taqdim etadi, bu esa har ikki uchidan ham elementlarni tez-tez qo'shish yoki olib tashlashni talab qiladigan vaziyatlar uchun mos keladi.

Dequening asosiy xususiyatlari

Tez qo'shish va olib tashlash: deque har ikki uchidan ham elementlarni qo'shish va olib tashlash uchun O(1) vaqt murakkabligini taqdim etadi.
Thread-safe: deque thread-safe, bu uni parallel dasturlash muhitlari uchun mos qiladi.
Xotira samaradorligi: deque ichki mexanizmlarida ikki tomonlama bog'langan ro'yxatdan foydalanadi, bu tez-tez qo'shish va o'chirishlar uchun xotira sarfini optimallashtiradi.
Aylantirish: deque elementlarni samarali aylantirishni qo'llab-quvvatlaydi. Bu dumaloq buferlarni qayta ishlash yoki ma'lum algoritmlarni amalga oshirish kabi vazifalarda foydali bo'lishi mumkin.

Deque amaliy misollari

1. Cheklangan navbatni amalga oshirish

Cheklangan navbat bu maksimal hajmli navbatdir. Navbat to'la bo'lganda, yangi element qo'shish eng qadimgi elementni olib tashlaydi. Bu kiruvchi ma'lumotlar uchun cheklangan buferni boshqarish yoki siljish oynasini amalga oshirish kabi vaziyatlarda foydalidir.

            from collections import deque

def bounded_queue(iterable, maxlen):
    d = deque(maxlen=maxlen)
    for item in iterable:
        d.append(item)
    return d

# Misol foydalanish
data = range(10)
queue = bounded_queue(data, 5)
print(queue)  # Natija: deque([5, 6, 7, 8, 9], maxlen=5)

Ushbu misolda biz maksimal uzunligi 5 bo'lgan dequeni yaratamiz. Biz range(10) dan elementlarni qo'shganimizda, eski elementlar avtomatik ravishda chiqariladi, bu navbatning maksimal hajmini oshirmasligini ta'minlaydi.

2. Siljish oynasi o'rtachasini amalga oshirish

Siljish oynasi o'rtachasi ma'lumotlar ketma-ketligi bo'ylab siljib o'tayotgan vaqtda belgilangan o'lchamdagi oynaning o'rtachasini hisoblaydi. Bu ma'lumotlardagi o'zgarishlarni tekislash kerak bo'lgan signallarni qayta ishlash, moliyaviy tahlillar va boshqa sohalarda keng tarqalgan.

            from collections import deque

def sliding_window_average(data, window_size):
    if window_size > len(data):
        raise ValueError("Oyna hajmi ma'lumotlar uzunligidan katta bo'lishi mumkin emas")
    
    window = deque(maxlen=window_size)
    results = []

    for i, num in enumerate(data):
        window.append(num)
        if i >= window_size - 1:
            results.append(sum(window) / window_size)

    return results

# Misol foydalanish
data = [1, 3, 5, 7, 9, 11, 13, 15]
window_size = 3
averages = sliding_window_average(data, window_size)
print(averages) # Natija: [3.0, 5.0, 7.0, 9.0, 11.0, 13.0]

Bu yerda deque siljish oynasi vazifasini bajaradi, oynadagi joriy elementlarni samarali saqlaydi. Ma'lumotlar bo'ylab harakatlanar ekanmiz, yangi elementni qo'shamiz va o'rtachani hisoblaymiz, oynadagi eng qadimgi elementni avtomatik ravishda olib tashlaymiz.

3. Palindrom tekshirgichi

Palindrom — bu orqadan o'qilganda ham oldidan o'qilganda bir xil bo'lgan so'z, ibora, raqam yoki boshqa belgilar ketma-ketligidir. Deque yordamida biz biror satr palindrommi yoki yo'qmi ekanligini samarali tekshirishimiz mumkin.

            from collections import deque

def is_palindrome(text):
    text = ''.join(ch for ch in text.lower() if ch.isalnum())
    d = deque(text)
    while len(d) > 1:
        if d.popleft() != d.pop():
            return False
    return True

# Misol foydalanish
print(is_palindrome("madam"))       # Natija: True
print(is_palindrome("racecar"))    # Natija: True
print(is_palindrome("A man, a plan, a canal: Panama")) # Natija: True
print(is_palindrome("hello"))       # Natija: False

Ushbu funksiya avval matnni alfanumerik bo'lmagan belgilaridan tozalaydi va uni kichik harflarga o'tkazadi. Keyin u satrning har ikki uchidan belgilarni taqqoslash uchun deque'dan foydalanadi. Ushbu yondashuv juda katta satrlar bilan ishlayotganda an'anaviy satr kesmalariga nisbatan yaxshilangan ishlashni taklif etadi.

Deque qachon ishlatiladi?

Navbat yoki stekni amalga oshirish kerak bo'lganda.
Sekensiyaning har ikki uchidan elementlarni samarali qo'shish yoki olib tashlash kerak bo'lganda.
Thread-safe ma'lumotlar tuzilmalari bilan ishlayotganingizda.
Siljish oynasi algoritmini amalga oshirish kerak bo'lganda.

Counter: Samarali chastota tahlili

Counter nima?

Counter — bu xeshlanadigan ob'ektlarni sanash uchun maxsus mo'ljallangan lug'at subclassidir. U elementlarni lug'at kalitlari va ularning sonlarini lug'at qiymatlari sifatida saqlaydi. Counter ayniqsa chastota tahlili, ma'lumotlarni umumlashtirish va matnni qayta ishlash kabi vazifalar uchun foydalidir.

Counterning asosiy xususiyatlari

Samarali hisoblash: Counter har bir elementni ko'rganda uning sonini avtomatik ravishda oshiradi.
Matematik operatsiyalar: Counter qo'shish, ayirish, kesish va birlashma kabi matematik operatsiyalarni qo'llab-quvvatlaydi.
Eng ko'p uchraydigan elementlar: Counter eng ko'p uchraydigan elementlarni osongina olish uchun most_common() metodini taqdim etadi.
Oson boshlash: Counterni turli manbalardan, shu jumladan iteratsiyalar, lug'atlar va kalit so'zli argumentlardan boshlash mumkin.

Counter amaliy misollari

1. Matn faylidagi so'zlar chastotasini tahlil qilish

So'zlar chastotasini tahlil qilish tabiiy tilni qayta ishlash (NLP)dagi keng tarqalgan vazifadir. Counter matn faylidagi har bir so'zning sonini sanashni osonlashtiradi.

            from collections import Counter
import re

def word_frequency(filename):
    with open(filename, 'r', encoding='utf-8') as f:
        text = f.read()
    words = re.findall(r'\w+', text.lower())
    return Counter(words)

# Namoyish uchun namunaviy matn faylini yaratish
with open('example.txt', 'w', encoding='utf-8') as f:
    f.write("This is a simple example. This example demonstrates the power of Counter.")

# Misol foydalanish
word_counts = word_frequency('example.txt')
print(word_counts.most_common(5)) # Natija: [('this', 2), ('example', 2), ('a', 1), ('is', 1), ('simple', 1)]

Ushbu kod matn faylini o'qiydi, so'zlarni ajratib oladi, ularni kichik harflarga o'tkazadi, keyin har bir so'zning chastotasini sanash uchun Counterdan foydalanadi. most_common() metodi eng ko'p uchraydigan so'zlar va ularning sonini qaytaradi.

Faylni ochishda `encoding='utf-8'` ga e'tibor bering. Bu keng ko'lamli belgilar bilan ishlash uchun muhimdir, bu sizning kodingizni global miqyosda moslashtiradi.

2. Satrdagi belgilar chastotasini hisoblash

So'zlar chastotasiga o'xshab, siz satrdagi alohida belgilar chastotasini ham hisoblashingiz mumkin. Bu kriptografiya, ma'lumotlar siqish va matn tahlili kabi vazifalar uchun foydali bo'lishi mumkin.

            from collections import Counter

def character_frequency(text):
    return Counter(text)

# Misol foydalanish
text = "Hello World!"
char_counts = character_frequency(text)
print(char_counts) # Natija: Counter({'l': 3, 'o': 2, 'H': 1, 'e': 1, ' ': 1, 'W': 1, 'r': 1, 'd': 1, '!': 1})

Ushbu misol Counter satrdagi har bir belgi chastotasini qanchalik oson hisoblashini ko'rsatadi. U bo'shliqlarni va maxsus belgilarni alohida belgilar sifatida ko'rib chiqadi.

3. Sanagichlarni taqqoslash va birlashtirish

Counter sanagichlarni taqqoslash va birlashtirish imkonini beruvchi matematik operatsiyalarni qo'llab-quvvatlaydi. Bu ikki ma'lumot to'plami orasidagi umumiy elementlarni topish yoki chastotalardagi farqni hisoblash kabi vazifalar uchun foydali bo'lishi mumkin.

            from collections import Counter

counter1 = Counter(['a', 'b', 'c', 'a', 'b', 'b'])
counter2 = Counter(['b', 'c', 'd', 'd'])

# Qo'shish
combined_counter = counter1 + counter2
print(f"Qo'shilgan sanagich: {combined_counter}")  # Natija: Qo'shilgan sanagich: Counter({'b': 4, 'a': 2, 'c': 2, 'd': 2})

# Ayirish
difference_counter = counter1 - counter2
print(f"Farq sanagichi: {difference_counter}") # Natija: Farq sanagichi: Counter({'a': 2, 'b': 2})

# Kesish
intersection_counter = counter1 & counter2
print(f"Kesishgan sanagich: {intersection_counter}") # Natija: Kesishgan sanagich: Counter({'b': 1, 'c': 1})

# Birlashma
union_counter = counter1 | counter2
print(f"Birlashgan sanagich: {union_counter}") # Natija: Birlashgan sanagich: Counter({'b': 3, 'a': 2, 'c': 1, 'd': 2})

Ushbu misol Counter ob'ektlari ustida qo'shish, ayirish, kesish va birlashma operatsiyalarini qanday bajarishni ko'rsatadi. Ushbu operatsiyalar chastota ma'lumotlarini tahlil qilish va manipulyatsiya qilishning kuchli usulini taqdim etadi.

Counter qachon ishlatiladi?

Sekensiyadagi elementlar sonini hisoblash kerak bo'lganda.
Matn yoki boshqa ma'lumotlar ustida chastota tahlili o'tkazish kerak bo'lganda.
Chastota sonlarini taqqoslash va birlashtirish kerak bo'lganda.
Ma'lumotlar to'plamidagi eng ko'p uchraydigan elementlarni topish kerak bo'lganda.

defaultdict: Ma'lumotlar tuzilmalarini soddalashtirish

defaultdict nima?

defaultdict bu o'rnatilgan dict klassining subclassidir. U kam bo'lgan kalitlar uchun standart qiymatni taqdim etish uchun bitta usulni (__missing__()) qayta yozadi. Bu qiymatlarni joyida yaratish kerak bo'lgan lug'atlarni yaratish jarayonini soddalashtiradi.

defaultdictsiz, ko'pincha kam bo'lgan kalitlarni boshqarish uchun if key in dict: ... else: ... yoki dict.setdefault(key, default_value)dan foydalanishga to'g'ri keladi. defaultdict bu jarayonni soddalashtiradi, kodingizni yanada ixcham va o'qiladigan qiladi.

defaultdictning asosiy xususiyatlari

Avtomatik boshlanish: defaultdict kam bo'lgan kalitlarni standart qiymat bilan avtomatik ravishda boshlaydi, bu esa aniq tekshiruvlarga bo'lgan ehtiyojni yo'q qiladi.
Soddalashtirilgan ma'lumotlar tuzilmasi: defaultdict ro'yxatlar ro'yxati yoki lug'atlar lug'ati kabi murakkab ma'lumotlar tuzilmalarini yaratishni soddalashtiradi.
Yaxshilangan o'qilishi: defaultdict kodingizni yanada ixcham va tushunarli qiladi.

defaultdict amaliy misollari

1. Elementlarni toifalar bo'yicha guruhlash

Elementlarni toifalarga guruhlash ma'lumotlarni qayta ishlashdagi keng tarqalgan vazifadir. defaultdict har bir kalit toifa bo'lib, har bir qiymat o'sha toifaga tegishli elementlar ro'yxati bo'lgan lug'atni yaratishni osonlashtiradi.

            from collections import defaultdict

items = [('fruit', 'apple'), ('fruit', 'banana'), ('vegetable', 'carrot'), ('vegetable', 'broccoli'), ('fruit', 'orange')]

grouped_items = defaultdict(list)
for category, item in items:
    grouped_items[category].append(item)

print(grouped_items) # Natija: defaultdict(, {'fruit': ['apple', 'banana', 'orange'], 'vegetable': ['carrot', 'broccoli']})

Ushbu misolda biz defaultdict(list)dan foydalanib, har qanday kam bo'lgan kalit uchun standart qiymat bo'sh ro'yxat bo'lgan lug'atni yaratamiz. Elementlar bo'ylab harakatlanar ekanmiz, har bir elementni uning toifasiga tegishli ro'yxatga qo'shamiz. Bu toifa allaqachon lug'atda mavjudligini tekshirishga bo'lgan ehtiyojni yo'q qiladi.

2. Elementlarni toifalar bo'yicha hisoblash

Guruhlashga o'xshash, siz defaultdictdan har bir toifadagi elementlar sonini hisoblash uchun ham foydalanishingiz mumkin. Bu gistogrammalarni yaratish yoki ma'lumotlarni umumlashtirish kabi vazifalar uchun foydalidir.

            from collections import defaultdict

items = ['apple', 'banana', 'apple', 'orange', 'banana', 'apple']

item_counts = defaultdict(int)
for item in items:
    item_counts[item] += 1

print(item_counts) # Natija: defaultdict(, {'apple': 3, 'banana': 2, 'orange': 1})

Bu yerda biz defaultdict(int)dan foydalanib, har qanday kam bo'lgan kalit uchun standart qiymat 0 bo'lgan lug'atni yaratamiz. Elementlar bo'ylab harakatlanar ekanmiz, har bir elementga tegishli sonni oshiramiz. Bu hisoblash jarayonini soddalashtiradi va potentsial KeyError istisnolardan qochadi.

3. Graf ma'lumotlar tuzilmasini amalga oshirish

Graf — bu tugunlar (vertikal) va qirralardan iborat ma'lumotlar tuzilmasidir. Siz grafni lug'at yordamida ifodalashingiz mumkin, bu yerda har bir kalit tugun va har bir qiymat uning qo'shnilari ro'yxati bo'ladi. defaultdict bunday grafni yaratishni soddalashtiradi.

            from collections import defaultdict

# Graf uchun qo'shni ro'yxatni ifodalaydi
graph = defaultdict(list)

# Grafga qirralarni qo'shish
graph['A'].append('B')
graph['A'].append('C')
graph['B'].append('D')
graph['C'].append('E')

print(graph)  # Natija: defaultdict(, {'A': ['B', 'C'], 'B': ['D'], 'C': ['E']})

Ushbu misol graf ma'lumotlar tuzilmasini yaratish uchun defaultdictdan qanday foydalanishni ko'rsatadi. Har qanday kam bo'lgan tugun uchun standart qiymat bo'sh ro'yxatdir, bu tugunning dastlab qo'shnilari yo'qligini bildiradi. Bu Python'da graflarni ifodalashning keng tarqalgan va samarali usulidir.

defaultdict qachon ishlatiladi?

Kam bo'lgan kalitlar standart qiymatga ega bo'lishi kerak bo'lgan lug'at yaratish kerak bo'lganda.
Elementlarni toifalar bo'yicha guruhlash yoki toifalardagi elementlarni hisoblashda.
Ro'yxatlar ro'yxati yoki lug'atlar lug'ati kabi murakkab ma'lumotlar tuzilmalarini qurishda.
Qo'shimcha va o'qiladigan kod yozishni istaganingizda.

Optimizatsiya strategiyalari va mulohazalar

deque, Counter va defaultdict ma'lum vaziyatlarda ishlash afzalliklarini taqdim etsa-da, quyidagi optimallashtirish strategiyalari va mulohazalarni hisobga olish muhimdir:

Xotira sarfi: Ushbu ma'lumotlar tuzilmalarining xotira sarfini, ayniqsa katta ma'lumotlar to'plamlari bilan ishlayotganda, yodda tuting. Agar xotira cheklangan bo'lsa, ma'lumotlarni kichikroq qismlarda qayta ishlash uchun generatorlar yoki iteratorlardan foydalanishni ko'rib chiqing.
Algoritm murakkabligi: Ushbu ma'lumotlar tuzilmalarida bajarilayotgan amallarning vaqt murakkabligini tushuning. Vazifa uchun to'g'ri ma'lumotlar tuzilmasini va algoritmni tanlang. Masalan, tasodifiy kirish uchun `deque`dan foydalanish `list`dan foydalanishga qaraganda kamroq samarali.
Profil yaratish: Kodingizdagi ishlashni sekinlashtiruvchi omillarni aniqlash uchun `cProfile` kabi profil yaratish vositalaridan foydalaning. Bu deque, Counter yoki defaultdict dan foydalanish haqiqatan ham ishlashni yaxshilayotganligini aniqlashga yordam beradi.
Python versiyalari: Ishlash xususiyatlari turli Python versiyalarida farq qilishi mumkin. Optimal ishlashni ta'minlash uchun kodingizni maqsadli Python versiyasida sinab ko'ring.

Global mulohazalar

Global auditoriya uchun dasturlar ishlab chiqishda, xalqaro miqyosda dasturlash (i18n) va lokalizatsiya (l10n) bo'yicha eng yaxshi amaliyotlarni hisobga olish muhimdir. Mana collections modulini global kontekstda ishlatish bilan bog'liq ba'zi mulohazalar:

Unicode qo'llab-quvvatlashi: Kodningiz, ayniqsa matn ma'lumotlari bilan ishlayotganda, Unicode belgilarini to'g'ri qayta ishlanishini ta'minlang. Barcha matn fayllari va satrlar uchun UTF-8 kodlashidan foydalaning.
Locale-ga moslashtirilgan saralash: Ma'lumotlarni saralashda, locale-ga moslashtirilgan saralash qoidalarini yodda tuting. Turli tillar va mintaqalar uchun ma'lumotlar to'g'ri saralanishini ta'minlash uchun locale modulidan foydalaning.
Matn segmentatsiyasi: So'zlar chastotasini tahlil qilishda, turli tillar uchun mos bo'lgan yanada murakkab matn segmentatsiyasi usullaridan foydalanishni ko'rib chiqing. Oddiy bo'shliqlarni ajratish Xitoy yoki Yaponiyadagi kabi tillar uchun yaxshi ishlamasligi mumkin.
Madaniy sezgirlik: Foydalanuvchilarga ma'lumotlarni ko'rsatishda madaniy farqlarni hisobga oling. Masalan, sana va raqam formatlari turli mintaqalarda farq qiladi.

Xulosa

Pythonning collections moduli samarali ma'lumotlarni manipulyatsiya qilish uchun kuchli vositalarni taqdim etadi. deque, Counter va defaultdict qobiliyatlarini tushunish orqali siz yanada ixcham, o'qiladigan va samarali kod yozishingiz mumkin. Dasturlaringiz samarali va global miqyosda mos kelishini ta'minlash uchun ushbu qo'llanmada muhokama qilingan optimallashtirish strategiyalari va global mulohazalarni yodda tuting. Ushbu vositalarda ustalaşmak, shubhasiz, Python dasturlash ko'nikmalaringizni oshiradi va sizga yanada osonlik va ishonch bilan murakkab ma'lumotlar muammolarini hal qilish imkonini beradi.